DatumBox - 机器学习、统计和软件开发博客领域信息情报检索

Datumbox博客专注于机器学习、统计学、人工智能及其在软件开发和在线营销中的应用。

用 Ja​​va 编写的新型开源机器学习框架

New open-source Machine Learning Framework written in Java

我很高兴地宣布,Datumbox 机器学习框架现在在 GPL 3.0 下开源,您可以从 Github 下载其代码!这个框架是什么? Datumbox 机器学习框架是一个用 Java 编写的开源框架,可以快速开发机器学习模型和统计应用程序。它 […]

使用 Java 中的狄利克雷过程混合模型进行聚类

Clustering with Dirichlet Process Mixture Model in Java

在之前的文章中,我们详细讨论了狄利克雷过程混合模型及其在聚类分析中的应用。在本文中,我们将介绍两种不同 DPMM 模型的 Java 实现:可用于聚类高斯数据的 Dirichlet 多元正态混合模型和 Dirichlet-多项式混合模型 […]

使用狄利克雷过程混合模型对文档和高斯数据进行聚类

Clustering documents and gaussian data with Dirichlet Process Mixture Models

本文是使用 DPMM 进行聚类教程的第五部分。在之前的文章中,我们详细介绍了该方法的理论背景,并描述了它的数学表示和构建方法。在这篇文章中,我们将尝试通过介绍两个模型将理论与实践联系起来 […]

狄利克雷过程混合模型

The Dirichlet Process Mixture Model

这篇博文是关于使用狄利克雷过程混合模型进行聚类的系列文章的第四部分。在之前的文章中,我们讨论了有限狄利克雷混合模型,我们将其模型的极限用于无限 k 个聚类,这导致我们引入了狄利克雷过程。正如我们所见,我们的目标是 [...]

狄利克雷过程、中餐馆过程和其他表示

The Dirichlet Process the Chinese Restaurant Process and other representations

本文是关于使用狄利克雷过程混合模型进行聚类的系列文章的第三部分。上一次我们根据狄利克雷分布定义了有限混合模型,并提出了如何使这个特定模型无限的问题。我们简要讨论了在 […]

基于狄利克雷分布的有限混合模型

Finite Mixture Model based on Dirichlet Distribution

这篇博文是关于狄利克雷过程混合模型的系列文章的第二部分。在上一篇文章中,我们概述了几种聚类分析技术,并讨论了使用它们时出现的一些问题/限制。此外,我们简要介绍了狄利克雷过程混合模型,并讨论了它们为什么 [...]

聚类分析和狄利克雷过程混合模型概述

Overview of Cluster Analysis and Dirichlet Process Mixture Models

在伦敦帝国理工学院机器学习硕士学位的 ISO 研究项目中,我专注于使用狄利克雷过程混合模型进行聚类分析的问题。DPMM 是一种“完全贝叶斯”无监督学习技术,与其他聚类分析方法不同,它不需要我们预先定义聚类总数 [...]

使用人工智能解决 2048 游戏(JAVA 代码)

Using Artificial Intelligence to solve the 2048 Game (JAVA code)

到目前为止,你们大多数人都听过/玩过 Gabriele Cirulli 的 2048 游戏。这是一个简单但极具吸引力的棋盘游戏,要求您将单元格的数字组合起来以达到数字 2048。正如预期的那样,随着更多单元格填充高值,游戏的难度会增加。个人 […]

使用 JAVA 中的 DEA 测量页面的社交媒体流行度

Measuring the Social Media Popularity of Pages with DEA in JAVA

在上一篇文章中,我们讨论了数据包络分析技术,并了解了如何将其用作有效的非参数排名算法。在这篇博文中,我们将用 JAVA 开发数据包络分析的实现,并使用它来评估社交媒体的流行度 […]

数据包络分析教程

Data Envelopment Analysis Tutorial

数据包络分析,也称为 DEA,是一种执行前沿分析的非参数方法。它使用线性规划来估计多个决策单元的效率,通常用于生产、管理和经济。该技术最初由 Charnes、Cooper 和 Rhodes 于 1978 年提出,从那时起它就成为 […]

如何构建自己的 Facebook 情绪分析工具

How to build your own Facebook Sentiment Analysis Tool

在本文中,我们将讨论如何轻松构建一个简单的 Facebook 情绪分析工具,该工具能够将公共帖子(来自用户和页面)分类为正面、负面和中性。我们将使用 Facebook 的 Graph API Search 和 Datumbox API 1.0v。类似于 Twitter 情绪分析工具 […]

在 JAVA 中开发朴素贝叶斯文本分类器

Developing a Naive Bayes Text Classifier in JAVA

在之前的文章中,我们讨论了朴素贝叶斯文本分类器的理论背景以及在文本分类中使用特征选择技术的重要性。在本文中,我们将把所有内容放在一起,并在 JAVA 中构建朴素贝叶斯文本分类算法的简单实现。分类器的代码是 […]

在文本分类中使用特征选择方法

Using Feature Selection Methods in Text Classification

在文本分类中,特征选择是选择训练集术语的特定子集并仅在分类算法中使用它们的过程。特征选择过程发生在分类器训练之前。更新:Datumbox 机器学习框架现在是开源的,可以免费下载。检查 […]